مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابه‌جایی وزن‌دار

author

Abstract:

Finding high-quality web pages is one of the most important tasks of search engines. The relevance between the documents found and the query searched depends on the user observation and increases the complexity of ranking algorithms. The other issue is that users often explore just the first 10 to 20 results while millions of pages related to a query may exist. So search engines have to use suitable algorithms with high performance to find the most relevant pages. The ranking section is an important part of search engines. Ranking is a process in which the web page quality is estimated by the search engine. There are two main methods for ranking web pages. In the first method, ranking is done based on the documents’ content (traditional rankings). Models, such as Boolean model, probability model and vector space model are used to rank documents based on their contents. In the second method, based on the graph, web connections and the importance of web pages, ranking process is performed. Based on researches on search engines, the majority of user queries is more than one term. For queries with more than one term, two models can be used. The first model assumes that query terms are independent of each other while the second model considers a location and order dependency between query terms. Experiments show that in the majority of queries there are dependencies between terms. One of the parameters that can specify dependencies between query terms is the distance between query terms in the document. In this paper, a new definition of distance based on Minimum Weighted Displacement Model (MWDM) of document terms to accommodate the query terms is presented. In the Minimum Weighted Displacement Model (MWDM), we call the minimum number of words moving a text to match the query term by space. In addition, because most of the ranking algorithms use the TF (Term Frequency) to score documents and for queries more than one term, there is no clear definition of these parameters; in this paper, according to the new distance concept, Phrase Frequency and Inverted Document Frequency are defined. Also, algorithms to calculate them are presented. The results of the proposed algorithm compared with multiple corresponding algorithms shows a favorable increase in average precision.  

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

بررسی میزان استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان بر اساس مدل پذیرش فناوری (TAM)

چکیده: زمینه و هدف: امروزه اینترنت به یکی از منابع مهم برای جستجوی اطلاعات سلامت تبدیل شده است که یکی از مهمترین گروه‌های استفاده کننده از آن برای جستجوی اطلاعات سلامت را زنان تشکیل می‌دهند. مواد و روشها: مطالعه حاضر یک پژوهش کمی از نوع توصیفی- تحلیلی است و استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان را با استفاده از مدل پذیرش فناوری مورد ارزیابی قرار داده است. ابزار مورد استفاده ...

full text

امدادرسانی زمان‌مند بر اساس جستجوی فراکتال

پس از وقوع بحران، آمادگی برایامدادرسانی کارآمدنقشی اساسی در کاهش هزینه‌ها و تلفات انسانی احتمالی حادثه خواهد داشت. امدادرسانی به‌عنوان یکی از مهم‌ترین مراحل توسعه سامانه‌های مدیریت بحران شناخته می‌شود. به منظور توسعه رویکردی کارا برای امدادرسانی زمان‌مند، در این پژوهش به حل مسئله‌ای بر اساس مسئله مسیریابی موجودی با وضعیت چند دوره‌ای و چند کالایی پرداخته شده است. جهت حل مدل، از یک الگوریتم بهبود...

full text

زیرگونه جدیدی از سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) برای ایران بر اساس داده‌های مولکولی

سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) گیاهی دارویی، مقاوم به خشکی، تثبیت‎کننده­ ازت و یک گونه پیش‌آهنگ جنگلی است. در این پژوهش برای اولین بار در ایران، شناسایی مولکولی سنجد تلخ در رویشگاه­های مختلف کشور و مقایسه­ آنها با زیرگونه­های شناخته شده در سایر نقاط جهان انجام شد. از پنج رویشگاه در استان­های البرز، مازندران، آذربایجان‌شرقی و غربی و قزوین نمونه­برداری انجام گردید. از نشانگر هسته­ا...

full text

تعیین شاخص سوز باد استان اصفهان بر اساس دمای کمینه

آب و هوا تاثیر بسیار مهمی در حیات موجودات زنده کره زمین دارد. وزش باد با دما اثر تلفیقی احساس محیط را ایجاد می‌نماید، بطوریکه به کاهش دما همراه با باد، سوزباد و برعکس آن گرم باد اطلاق می‌شود. در این تحقیق سوزباد دمای کمینه در استان اصفهان مورد بررسی قرار گرفت. دمای کمینه و سرعت وزش باد برای 10 ایستگاه همدیدی استان طی دوره آماری 1372 تا 1394 از سازمان هواشناسی کشور تهیه گردید. نتایج نشان داد...

full text

رشد درونزا: یک مدل جستجوی تصادفی برای فن آوری جدید

این مقاله رشد درونزا، بر پویایی مدلی در انباشت دانش تاکید دارد. با توجه به نا اطمینانی موجود در هر فرایند جستجو، مدل یک ساختار پویای تصادفی که در آن فن آوری و انباشت دانش مکمل همدیگر می باشند ارائه می‌کند که هر یک از دو موتور رشد انباشت سرمایه و فن آوری تا یک نقطه مکمل همدیگر می باشند و بعد از آن تاثیر هریک مقید به سطح دیگری است. نشان داده می‌شود که هر دو عامل انباشت سرمایه و پیشرفت فن آوری برا...

full text

اصلاح مدل بیلان حجمی با بهبود عبارت ذخیره سطحی برای آبیاری جویچه ای

راندمان سیستمهای آبیاری سطحی در ایران بسیار پائین است. در صورتیکه بتوان پارامترهای مهم و موثر در طراحیآبیاری سطحی، از قبیل فرصت نفوذ و زمان پیشروی را در ازای یک دبی مشخصبه خوبی برآورد کرد، میتوانراندمان کاربرد این سیستم را به مقدار قابل توجهی افزایش داد. مدل بیلان حجمی یکی از مدلهای ساده و رایج درطراحی و ارزیابی آبیاری جویچهای میباشد. با توجه به فرضیاتی که در مدل بیلان حجمی اعمال میشود دقت این ...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 15  issue 4

pages  71- 84

publication date 2019-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023